保持好奇心進入數據世界是個好的開始,可以回顧 Day 1 提到的從好奇心出發。接著你會發現有好多專業技能、工具跟知識,該怎麼選擇呢?
試算表是最普遍的數據工具。每個人都容易獲取或開始使用,甚至多數人會使用基本的公式,像是 SUM(), AVERAGE() ,分析技巧,如加入樞紐分析表,以及簡單的圖表,如圓餅圖。
一但你會使用試算表,你就可以成為很好的 data practitioner.
有個強者朋友總說,會用試算的人就可以學會寫程式。他在公司當顧問的時候,會要求該公司推薦一名擅長試算表的員工,訓練該員工作為在他的諮詢結束後,負責維護數據專案的人。
當你摸索試算表,你會學到什麼是維度和指標、SUM、AVERAGE、MIN、MAX 等基本數據知識。這些可能是你的未知-已知:你可能沒有意識到你已經掌握基本的數據知識 🤩。當我幾年前招募暑期實習生時,我請他們解釋違度跟指標的差異,在 20 多位大二、三學生中,只有 2 位可以說明。
我是因為試算表太大打不開才開始學習數據。此時,我只會試算表而已。當我開始探索更多試算表知識,偶然發現了一個很好的資源 BenCollins, 幫助我提升試算表技能,並在他的網站上發現了 App Script。
我的任務是比較合作廣告聯盟的成效,超過 10 家以上:
試算表在我的問題中扮演了重要的角色,雖然不是完美的解決方案。重複這些步驟大概佔我每天 30% 的時間 😣。
讓我介紹用這個例子,說明已知-未知矩陣:
已知 | 未知 | |
---|---|---|
已知 | 已知-已知 e.g. 我知道要做這 3 個步驟 | 已知-未知 e.g. 我不知道如何節省時間 |
未知 | 未知-已知 e.g. 我不知道我已具備資本數據知識 | 未知-未知 e.g. App Script, 在還沒發現 Ben 之前,我不知道有這個 |
直到我探索未知,我才發現 App Script. 這個探索,就將 App Script 從未知-未知移到了已知-未知,從完全沒聽過,到知道有這個工具,只是我還不太會用。當我開始應用來嘗試省去重複步驟,我發現它也不是最佳解法,但我至少又把它從已知-未知移去已知-已知。
讓我們再回到問題。你的挑戰是什麼?你想解決什麼問題?
嘗試新的工具或方法,實驗將它們套用來解決你的問題,看可不可以。擁抱學習的精神。
接著,用此方法,我開始探索 Python 跟 SQL,然後發現這才能解決我的問題。
Google 是最好的搜尋工具,但你需要知道要輸入什麼關鍵字。可以從你已知常識開始找關鍵字,接著你會從搜尋結果中發現新的關鍵字。這也是一種破除未知的方法。
提供許多不錯的免費資源:
當你得到方向,例如發現了 Python 或 SQL, 也有很多免費資源可以幫助你學習:
記得回到你的問題,你想做什麼?哪些問題一直在你腦海裡揮之不去?
去 Google 你的問題,然後你會學會如何將問題描述清楚、如何找答案。當你開始這麼做,你就獲得更多知識,也開始將你的未知-未知移動到已知-未知或者已知-未知移動到已知-已知。
當你完成許多小任務、解決許多小問題,開始有更多的已知-未知或已知-已知,你可能會覺得缺少宏觀的概念。如果你有點餘裕,不用太急著交付成果,有時間可以做點實驗、嘗試新東西。
此時就是很好的時機,去找個課程來強化你的知識。一樣有很多免費資源可以幫助你:
應用所學是很重要的。光是交作業或通過考試不夠。試著將你上課所學,應用到你的實際問題上,可以增強理解也給你更大的動機去學習。
在這篇文章中,我鼓勵你探索數據世界,嘗試解決你的問題。保持好奇心和動機將讓你成為一名終身學習者。在下一篇文章中,我想提示幾個在你踏出第一步後,可能遇到的常見問題。
對 dbt 或 data 有興趣 👋?歡迎加入 dbt community 到 #local-taipei 找我們,也有實體 Meetup 請到 dbt Taipei Meetup 報名參加